11 research outputs found

    Modularity-Based Clustering for Network-Constrained Trajectories

    Full text link
    We present a novel clustering approach for moving object trajectories that are constrained by an underlying road network. The approach builds a similarity graph based on these trajectories then uses modularity-optimization hiearchical graph clustering to regroup trajectories with similar profiles. Our experimental study shows the superiority of the proposed approach over classic hierarchical clustering and gives a brief insight to visualization of the clustering results.Comment: 20-th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning (ESANN 2012), Bruges : Belgium (2012

    Clustering par optimisation de la modularité pour trajectoires d'objets mobiles

    No full text
    National audienceAnalysis and data mining of moving objects trajectories have gained a considerable amount of interest in the last few years. In this article, we present a clustering approach tailored for trajectories of vehicles moving on a road network. First, we introduce a similarity measure that makes it possible to compare such trajectories while taking into account the constraints of the underlying network. Then, this measure is used to construct a graph that models the interactions among the trajectories w.r.t. their similarity. A community detection algorithm based on modularity optimization is applied to the graph in order to discover groups of trajectories that behaved similarly and that moved along the same portions of the road network. We implemented the proposed approach and tested it on multiple synthetic datasets in order to show its feasibility and its efficiency

    Analyse et fouille de données de trajectoires d'objets mobiles

    Get PDF
    In this thesis, we explore two problems related to managing and mining moving object trajectories. First, we study the problem of sampling trajectory data streams. Storing the entirety of the trajectories provided by modern location-aware devices can entail severe storage and processing overheads. Therefore, adapted sampling techniques are necessary in order to discard unneeded positions and reduce the size of the trajectories while still preserving their key spatiotemporal features. In streaming environments, this process needs to be conducted "on-the-fly" since the data are transient and arrive continuously. To this end, we introduce a new sampling algorithm called spatiotemporal stream sampling (STSS). This algorithm is computationally-efficient and guarantees an upper bound for the approximation error introduced during the sampling process. Experimental results show that stss achieves good performances and can compete with more sophisticated and costly approaches. The second problem we study is clustering trajectory data in road network environments. We present three approaches to clustering such data: the first approach discovers clusters of trajectories that traveled along the same parts of the road network; the second approach is segment-oriented and aims to group together road segments based on trajectories that they have in common; the third approach combines both aspects and simultaneously clusters trajectories and road segments. We show how these approaches can be used to reveal useful knowledge about flow dynamics and characterize traffic in road networks. We also provide experimental results where we evaluate the performances of our propositions.Dans un premier temps, nous étudions l'échantillonnage de flux de trajectoires. Garder l'intégralité des trajectoires capturées par les terminaux de géo-localisation modernes peut s'avérer coûteux en espace de stockage et en temps de calcul. L'élaboration de techniques d'échantillonnage adaptées devient primordiale afin de réduire la taille des données en supprimant certaines positions tout en veillant à préserver le maximum des caractéristiques spatiotemporelles des trajectoires originales. Dans le contexte de flux de données, ces techniques doivent en plus être exécutées "à la volée" et s'adapter au caractère continu et éphémère des données. A cet effet, nous proposons l'algorithme STSS (spatiotemporal stream sampling) qui bénéficie d'une faible complexité temporelle et qui garantit une borne supérieure pour les erreurs d’échantillonnage. Nous montrons les performances de notre proposition en la comparant à d'autres approches existantes. Nous étudions également le problème de la classification non supervisée de trajectoires contraintes par un réseau routier. Nous proposons trois approches pour traiter ce cas. La première approche se focalise sur la découverte de groupes de trajectoires ayant parcouru les mêmes parties du réseau routier. La deuxième approche vise à grouper des segments routiers visités très fréquemment par les mêmes trajectoires. La troisième approche combine les deux aspects afin d'effectuer un co-clustering simultané des trajectoires et des segments. Nous démontrons comment ces approches peuvent servir à caractériser le trafic et les dynamiques de mouvement dans le réseau routier et réalisons des études expérimentales afin d'évaluer leurs performances

    Analysis and data mining of moving object trajectories

    No full text
    Dans un premier temps, nous étudions l'échantillonnage de flux de trajectoires. Garder l'intégralité des trajectoires capturées par les terminaux de géo-localisation modernes peut s'avérer coûteux en espace de stockage et en temps de calcul. L'élaboration de techniques d'échantillonnage adaptées devient primordiale afin de réduire la taille des données en supprimant certaines positions tout en veillant à préserver le maximum des caractéristiques spatiotemporelles des trajectoires originales. Dans le contexte de flux de données, ces techniques doivent en plus être exécutées "à la volée" et s'adapter au caractère continu et éphémère des données. A cet effet, nous proposons l'algorithme STSS (spatiotemporal stream sampling) qui bénéficie d'une faible complexité temporelle et qui garantit une borne supérieure pour les erreurs d’échantillonnage. Nous montrons les performances de notre proposition en la comparant à d'autres approches existantes. Nous étudions également le problème de la classification non supervisée de trajectoires contraintes par un réseau routier. Nous proposons trois approches pour traiter ce cas. La première approche se focalise sur la découverte de groupes de trajectoires ayant parcouru les mêmes parties du réseau routier. La deuxième approche vise à grouper des segments routiers visités très fréquemment par les mêmes trajectoires. La troisième approche combine les deux aspects afin d'effectuer un co-clustering simultané des trajectoires et des segments. Nous démontrons comment ces approches peuvent servir à caractériser le trafic et les dynamiques de mouvement dans le réseau routier et réalisons des études expérimentales afin d'évaluer leurs performances.In this thesis, we explore two problems related to managing and mining moving object trajectories. First, we study the problem of sampling trajectory data streams. Storing the entirety of the trajectories provided by modern location-aware devices can entail severe storage and processing overheads. Therefore, adapted sampling techniques are necessary in order to discard unneeded positions and reduce the size of the trajectories while still preserving their key spatiotemporal features. In streaming environments, this process needs to be conducted "on-the-fly" since the data are transient and arrive continuously. To this end, we introduce a new sampling algorithm called spatiotemporal stream sampling (STSS). This algorithm is computationally-efficient and guarantees an upper bound for the approximation error introduced during the sampling process. Experimental results show that stss achieves good performances and can compete with more sophisticated and costly approaches. The second problem we study is clustering trajectory data in road network environments. We present three approaches to clustering such data: the first approach discovers clusters of trajectories that traveled along the same parts of the road network; the second approach is segment-oriented and aims to group together road segments based on trajectories that they have in common; the third approach combines both aspects and simultaneously clusters trajectories and road segments. We show how these approaches can be used to reveal useful knowledge about flow dynamics and characterize traffic in road networks. We also provide experimental results where we evaluate the performances of our propositions

    Classifications croisées de données de trajectoires contraintes

    No full text
    International audienceLe clustering (ou classification non supervisée) de trajectoires a fait l'objet d'un nombre considérable de travaux de recherche. La majorité de ces travaux s'est intéressée au cas où les objets mobiles engendrant ces trajectoires se déplacent librement dans un espace euclidien et ne prennent pas en compte les contraintes liées à la structure sous-jacente du réseau qu'ils parcourent (ex. réseau routier). Dans le présent article, nous proposons au contraire la prise en compte explicite de ces contraintes. Nous représenterons les relations entre trajectoires et segments routiers par un graphe biparti et nous étudierons la classification de ses sommets. Nous illustrerons, sur un jeu de données synthétiques, l'utilité d'une telle étude pour comprendre la dynamique du mouvement dans le réseau routier et analyser le comportement des véhicules qui l'empruntent

    Clustering Smart Card Data for Urban Mobility Analysis

    No full text
    Smart card data gathered by Automated Fare Collection (AFC) systems are a valuable resource for studying urban mobility. In this paper, we propose two approaches to clustering smart card data that can be used to extract mobility patterns in a public transportation system. Two complementary standpoints are considered: a station-oriented, operational point of view and a passenger-focused one. The first approach clusters stations based on when their activity occurs, i.e. how trips made at the stations are distributed over time. The second approach makes it possible to identify groups of passengers that have similar boarding times aggregated into weekly profiles. By applying our approaches to a real dataset issued from the metropolitan area of Rennes (France) we illustrate how they can help reveal valuable insights about urban mobility like the presence of different station key-roles such as residential stations used mostly in the mornings, work stations used only in the evening and almost exclusively during weekdays, etc. as well as different passenger behaviors ranging from the sporadic and diffuse usage to typical commute practices. By cross-comparing passenger clusters with fare types, we also highlight how certain usages are more specific to particular types of passengers

    Intermodal mobility analysis with smart-card data. Spatio-temporal analysis of the bus-metro network of Rennes metropole

    No full text
    This paper aims to analyse the intermodal practices of mobility in the bus-metro network of Rennes metropole. Intermodality being strongly linked to the use of urban public transport networks, the Rennes Métropole bus and metro network data provided by Keolis-Rennes provides a very significant part of daily intermodality. To compensate for the lack of information on destinations and correspondances in the ticketing data a reconstruction of trips was made on the basis of hypotheses provided by the literature. The research carried out in the "Mobilletic" project considerably deepened the understanding of the temporal and spatial dimensions of intermodal mobility within Rennes Métropole’s urban public transport network.daily mobility, public transport, data science, data analysis, intermodal transportatio

    Classification à base de modèle de mélange pour l'identification de profils temporels types d'usagers de transport public

    No full text
    AAFD & SFC'16 - Francophone International Conference on Data Science, Marrakech , MAROC, 22-/05/2016 - 26/05/2016Dans le domaine des transports, l'analyse des mobilités des personnes peut s'appuyer sur des traces numériques de plus en plus nombreuses générées lors de nos déplacements. Cet article est dédié à l'identification de profils types de mobilité d'usagers à partir de leurs données de validation sur un réseau de transport collectif. L'approche proposée est basée sur un modèle génératif à deux niveaux dont le premier permet de regrouper les usagers en fonction de leur activité temporelle, tandis que le second niveau modélise cette activité temporelle au sein de chaque groupe à l'aide d'un mélange de Gaussiennes. Les expérimentations sont menées sur des données billettiques réelles collectées sur le réseau de transport collectif de Rennes métropole. Les résultats obtenus montrent que les profils temporels des différents groupes sont étroitement liés aux activités génératrices de déplacement et aux modes de vie des usagers
    corecore